from pyflink.datastream import StreamExecutionEnvironment, MapFunction, RuntimeExecutionMode

# 1、创建flink执行环境
env = StreamExecutionEnvironment.get_execution_environment()


# 修改处理模式
env.set_runtime_mode(RuntimeExecutionMode.BATCH)

# 修改并行度
env.set_parallelism(1)

# 2、读取数据,得到DataStream，相当于RDD  （有界流）
lines_ds = env.read_text_file("../../data/students.txt")

# 缓存数据
lines_ds_cache = lines_ds.cache()

lines_ds_cache.print()

# execute: 触发任务执行
env.execute()

lines_ds_cache.print()
env.execute()